استخراج خودکار روابط رده بندی مفاهیم از متون بدون ساختار با استفاده از روش های هوشمند پردازش متن

پایان نامه
چکیده

برای بدست آوردن روابط سلسله مراتبی در یک متن بدون ساختار، ابتدا به کمک روشهای هوشمند پردازش متن و استفاده از روابط معنایی، تمام عبارت هایی را که در متن نقش کلیدی دارند را استخراج میکنیم. هر کدام از این عبارت ها عضوی از گراف نهایی تولید شده ار متن خواهد بود. سپس با استفاده از الگوریتم خاصی به استخراج ابرنام(hypernym) هر یک از عبارت ها میپردازیم و به صورت بازگشتی این عمل تکرار می شود تا گراف روابط سلسله مراتبی کامل شود. در مراحل بعد به با استفاده وزن دهی یالهای گراف به هرس کردن گراف میپردازیم و تمام حلقه های گراف را از بین میبریم و نمودار نهایی به صورت درخت خواهد بود. در آخر ممکن است چون محتمل است که نمودار کمبود اطلاعات داشته باشد به بازیابی برخی از روابط هرس شده ی مفید میپردازیم.

منابع مشابه

رده بندی خودکار متون با استفاده از روش های هوش محاسباتی

با رشد چشم گیر استفاده از اینترنت، حجم اسناد متنی دیجیتال موجود نیز به صورت نمایی افزایش می یابد. از این رو، یافتن اطلاعات مفید از این اسناد متنی در کاربردهای بسیاری اهمیت پیدا کرده است که رده بندی خودکار متون، تکنولوژی کلیدی برای این منظور است. به ازای هر سند متنی، واژه‎ها نقش ویژگی را در رده بندی ایفا می کنند که با توجه به حجم زیاد واژه در زبان طبیعی، این مسأله منجر به ایجاد مشکل ابعاد زیاد و...

بهبود خلاصه سازی خودکار متون فارسی با استفاده از روش‌های پردازش زبان طبیعی و گراف شباهت

A significant amount of available information is stored in textual databases which contains a large collection of documents from different sources (such as news, articles, books, emails and web pages). The increasing visibility and importance of this class of information motivates us to work on having better automatic evaluation tools for textual resources. The automatic summarization of tex...

متن کامل

استخراج خودکار عبارتهای کلیدی از متون مقاله‌های فارسی

در پژوهش حاضر، عبارتهای کلیدی از متون مقاله‌های فارسی به صورت خودکار جداسازی گردیده است. استخراج عبارتها مبتنی بر روشهای آماری، نحوة توزیع واژگان، مجاورت و ... صورت پذیرفته است. سیستمی که بر پایه پژوهش حاضر طراحی گردیده، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، به گونه‌ای که در طول زمان مرتباً به کارایی آن افز...

متن کامل

مفاهیم مثلث بندی هوایی خودکار

اساس کار در فتوگرامتری رقومی، تصاویر رقومی است. با داشتن این تصاویر اندازه­ گیری اتوماتیک امکان ­پذیر خواهد بود. یکی از وظایف اصلی در مثلث ­بندی هوایی، اندازه گیری تصاویر است سازماندهی در روند اندازه­ گیری­ها در کارایی مثلث ­بندی هوایی مؤثر است. از امتیازات مطرح در فتوگرامتری رقومی انجام قدم به قدم تمام مراحل کار با استفاده از کامپیوتر می­ باشد. مشخصه اصلی مثلث­ بندی هوایی خودکار، در روش ­های ا...

متن کامل

جداسازی خودکار کانی های موجود در مقاطع نازک سنگ ها با استفاده از الگوریتم های پردازش تصویر و خوشه بندی

جداسازی خودکار کانی‌ های موجود در مقاطع نازک با استفاده از روش‌های پردازش تصویر، یکی از موضوعاتی است که در سال‌های اخیر مورد توجه زمین‌ شناسان قرار گرفته است. سنگ‌ها اصلی‌ترین منبع اطلاعاتی زمین‌ شناسان می‌باشند، و یکی از روش‌های متداول مطالعه سنگ‌ها، تهیه مقاطع نازک از آن‌ها و بررسی این مقاطع با استفاده از میکروسکوپ‌ های انکساری قطبی کننده نور است. همچنین جداسازی کانی‌ های موجود در مقاطع نازک،...

متن کامل

استخراج خودکار جملات هم‌تراز انگلیسی-فارسی از متون مقایسه‌ای با بهره‌برداری از اطلاعات نحوی

پیکره‌های موازی همواره از غنی‌ترین منابع در مباحث پردازش زبان طبیعی محسوب می‌شوند.  این نوع پیکره‌ها شامل متون ترجمه‌شدۀ دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله هم‌ترازشده‌اند. علیرغم کاربرد فراوان این نوع پیکره‌ها در مطالعات مختلف از جمله پژوهش­های زبانی، ترجمة ماشینی آماری و سامانه‌های خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکره‌های موازی مو...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه بوعلی سینا - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023